自Mikolov等人的开创性工作以来。 (2013A)和Bojanowski等。 (2017),浅日志双线性语言模型的单词表示已成为许多NLP应用程序。 Mikolov等人。 (2018)介绍了一个位置日志双线性语言模型,具有基于关注的语言模型的特征,并且在内在单词类比任务上达到了最先进的性能。然而,位置模型从未评估了定性标准或外在任务,其速度是不切实际的。我们概述了注意机制与位置模型之间的相似性,并提出了一个受约束的位置模型,它适应Dai等人的稀疏注意机制。 (2018)。我们评估了三个新型定性标准的位置和受约束的位置模型及其对两种和布鲁森的外在语言建模任务(2014)。我们表明,位置和约束位置模型包含有关字令的可解释信息,优于Bojanowski等人的子字模型。 (2017)语言建模。我们还表明,受约束的位置模型优于语言建模的位置模型,并且是快速的两倍。
translated by 谷歌翻译
We consider partially observable Markov decision processes (POMDPs) modeling an agent that needs a supply of a certain resource (e.g., electricity stored in batteries) to operate correctly. The resource is consumed by agent's actions and can be replenished only in certain states. The agent aims to minimize the expected cost of reaching some goal while preventing resource exhaustion, a problem we call \emph{resource-constrained goal optimization} (RSGO). We take a two-step approach to the RSGO problem. First, using formal methods techniques, we design an algorithm computing a \emph{shield} for a given scenario: a procedure that observes the agent and prevents it from using actions that might eventually lead to resource exhaustion. Second, we augment the POMCP heuristic search algorithm for POMDP planning with our shields to obtain an algorithm solving the RSGO problem. We implement our algorithm and present experiments showing its applicability to benchmarks from the literature.
translated by 谷歌翻译
该报告解释,实施和扩展了“更紧密的变化界限不一定更好”所介绍的作品(T Rainforth等,2018)。我们提供了理论和经验证据,这些证据增加了重要性的重要性数量$ k $在重要性加权自动编码器(IWAE)中(Burda等,2016)降低了推理中梯度估计量的信噪比(SNR)网络,从而影响完整的学习过程。换句话说,即使增加$ k $减少了梯度的标准偏差,但它也会更快地降低真实梯度的幅度,从而增加梯度更新的相对差异。进行广泛的实验以了解$ k $的重要性。这些实验表明,更紧密的变化界限对生成网络有益,而宽松的边界对推理网络来说是可取的。通过这些见解,可以实施和研究三种方法:部分重要性加权自动编码器(PIWAE),倍增重要性加权自动编码器(MIWAE)和组合重要性加权自动编码器(CIWAE)。这三种方法中的每一种都需要IWAE作为一种特殊情况,但采用不同的重量权重,以确保较高的梯度估计器的SNR。在我们的研究和分析中,这些算法的疗效在多个数据集(如MNIST和Omniglot)上进行了测试。最后,我们证明了三种呈现的IWAE变化能够产生近似后验分布,这些分布与IWAE更接近真正的后验分布,同时匹配IWAE生成网络的性能,或者在PIWAE的情况下可能超过其表现。
translated by 谷歌翻译
本文通过讨论参加了为期三年的SubT竞赛的六支球队的不同大满贯策略和成果,报道了地下大满贯的现状。特别是,本文有四个主要目标。首先,我们审查团队采用的算法,架构和系统;特别重点是以激光雷达以激光雷达为中心的SLAM解决方案(几乎所有竞争中所有团队的首选方法),异质的多机器人操作(包括空中机器人和地面机器人)和现实世界的地下操作(从存在需要处理严格的计算约束的晦涩之处)。我们不会回避讨论不同SubT SLAM系统背后的肮脏细节,这些系统通常会从技术论文中省略。其次,我们通过强调当前的SLAM系统的可能性以及我们认为与一些良好的系统工程有关的范围来讨论该领域的成熟度。第三,我们概述了我们认为是基本的开放问题,这些问题可能需要进一步的研究才能突破。最后,我们提供了在SubT挑战和相关工作期间生产的开源SLAM实现和数据集的列表,并构成了研究人员和从业人员的有用资源。
translated by 谷歌翻译
在本文中,我们介绍了基于变化自动编码器(VAES)的卫星数据在卫星数据中改变检测的重量轻,无人监督的方法,具体用途。灾害管理等诸如诸如卫星观测的快速可用性的灾害。传统上,在将所有数据转移到地面后,在地面上执行数据分析 - 向地面站进行。因此,对下行链路功能的约束会影响任何下游应用程序。相比之下,Ravaen直接在卫星上预处理采样的数据,并标志改变了下行链路的优先级,缩短了响应时间。我们验证了我们的系统对由时间赛事的时间系列组成的效果 - 我们计划与本出版物一起发布 - 证明拉韦突出了像素明智的基准。最后,我们在资源限制硬件上测试了我们的方法,以评估计算和内存限制。
translated by 谷歌翻译